AI资讯新闻榜单内容搜索-LLaMA

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

10245 点击 2026-06-02 11:23

2026 年 3 月底，Ollama 发布了一则更新公告：其 Mac 版本的底层推理引擎，将从沿用多年的 llama.cpp 切换为苹果的 MLX 框架。

来自主题: AI技术研报

8370 点击 2026-05-06 15:19

一位中国开发者，在横跨大西洋的航程中，在飞机上用 MacBook 本地跑 Llama 70B，整整 11 小时没有网络，帖子瞬间在X上爆火！但是随后，越来越多网友发现，这故事不太对啊？

来自主题: AI资讯

9620 点击 2026-05-03 23:45

MiniMax M2.7 在今天正式开源。我们和华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA，以及 Together AI、Fireworks、Ollama 等海内外芯片厂商、推理平台携手，在开源首日即完成模型接入与推理适配工作，推动全球 AI 生态繁荣发展。

来自主题: AI资讯

9957 点击 2026-04-12 22:21

刚刚，Meta 重金组建的超级智能实验室（SML）交卷！这也是年轻华人 Alexandr Wang 带领该团队后，交出的首份成绩。全新自研模型 Muse Spark 上线。

来自主题: AI资讯

8793 点击 2026-04-09 09:26

刚刚推出的一款最新芯片，直接冲上硅谷热榜。峰值推理速度高达每秒17000个token。什么概念呢？当前公认最强的Cerebras，速度约为2000 token/s。速度直接快10倍，同时成本骤减20倍、功耗降低10倍。

来自主题: AI资讯

9896 点击 2026-02-22 01:21

路透社最新消息，Meta 新成立的 AI 团队本月已在内部交付了首批关键模型。据悉，该消息来自 Meta 公司的 CTO Andrew Bosworth，他表示该团队的 AI 模型「非常好」（very good）。

来自主题: AI资讯

9673 点击 2026-01-24 10:44

从救火Llama 4反被裁，再到如今下场自创业，AI大佬田渊栋回顾了2025年一些重要时刻。

来自主题: AI资讯

9465 点击 2026-01-04 15:27

图灵奖大佬LeCun离职Meta后直接开怼：实锤Llama4造假传闻，炮轰原上司Alexandr Wang「不懂科研」，称Meta冲刺「超级智能」完全是被大模型洗脑。同时，他也透露自己的新公司即将在今年发布全新世界模型。

来自主题: AI资讯

9022 点击 2026-01-03 22:24

本该绽放的Llama 4黯然失色，Meta内部地震频发：首席AI科学家离职、600人裁员、顶级大佬空降、开源战略转向。最新模型Avocado被曝延期且套壳Qwen，扎克伯格如何在对手狂飙中绝地反击？

来自主题: AI资讯

11264 点击 2025-12-11 16:04